Detección automática de paroxismos (página 2)

Enviado por Ing.Licdo. Yunior Andrés Castillo Silverio

Partes: 1, 2

Utilizando VISRED (software en el entorno Matlab) fue posible mantener la distancia entre los puntos del espacio de 14 dimensiones, a un espacio de 3D, y poder detectar los grupos de datos. Luego se aplicó un algoritmo para dividir en clusters o grupos (hierarchical, c-means, subtractive, etc.). La figura 16 muestra la representación 3D de los datos.

Figura 16 – Representación en VISRED

Se puede observar la representación en VISRED de la señal EEG de un paciente, dividida en los cuatro grupos. Grupo 1 – interictal, Grupo 2 – preictal, Grupo 3 – ictal, Grupo 4 – postictal

El análisis presentado a través de la metodología y la visualización de datos por medio de reducción del espacio sugiere que los elementos valuables pueden ser extraídos con esta metodología, incluso cuando son precedidos por una variación significante en esos atributos. El análisis con VISRED demostró la habilidad extraer los atributos para identificar la actividad preictal.

El análisis en multicanales

La utilización de más de un canal para clasificar la señal de un EEG es una técnica que se comenzó a utilizar para detectar correlación entre distintas zonas del cerebro. Un estudio realizado para identificar subconjuntos de estructuras co-activas demostró que existe una co-relación entre las distintas áreas del lóbulo temporal durante un ataque epiléptico [BOU/05].

Se presentó un método para analizar estáticamente la distribución de spikes o picos de una señal en un SEEG con multicanales intracerebrales. Éste extrajo automáticamente varios grupos de estructuras envueltas en la generación de actividad paroxística. Estos grupos fueron llamados "conjunto de estructuras co-activas" (CECA).

Se utilizaron los datos de 15 pacientes sometidos a un período de grabación de EEG intracerebrales utilizando electrodos profundos. La metodología utilizada constó de (i) la detección automática mono-canal de spikes (mono-IIS), (ii) la formación de multi-IIS utilizando una ventana deslizante temporal, (iii) y por último la extracción de CECA.

Los datos utilizados fueron señales SEEG grabadas con un máximo de 128 canales, y un muestreo de 256 hz, sin utilizar filtros digitales. Se seleccionó 1 hora de cada paciente, sobre 15 pacientes.

En la figura 17 se pueden apreciar una porción de la señal SEEG donde los mono-IIS fueron marcados horizontalmente con *, y verticalmente los multi-IIS.

Figura 17 – EEG.

Descripción del método:

Detección monocanal de ondas punta o spikes (mono-IIS). Se realizó mediante la detección de la ocurrencia de un spike en la señal de base. En este trabajo se utilizó una aproximación cuadrática para incrementar la relación señal-ruido. Para cada muestra de tiempo se aplicó un filtro wavelet y se calculó el módulo al cuadrado. Luego, para decidir si se encontraba presente o no un spike se utilizó un algoritmo Page-Hinkley. Este procedimiento resultó ser más sensible a los falsos negativos que a los falsos positivos.

Formación de ondas punta multicanales. En esta etapa se pretendió detectar al menos dos IIS en el mismo intervalo de tiempo. Para ello se utilizó un algoritmo basado en una ventana deslizante de cierta duración, donde se crea una matriz B booleana de NxM, donde la entrada bij es igual a 1, si un mono-IIS del canal i (1 = i = N) pertenece a la multi-IIS j (1 = j = M); sino, es 0

Extracción de un conjunto de estructuras co-activas (CECA). La extracción de CECAs se basa en la definición de la co-concurrencia entre las IIS y la formulación de criterios estáticos para la detección de tales co-ocurrencias. Se utilizaron funciones de probabilidad y estadísticas.

La detección de mono-IIS varió significativamente de paciente en paciente, y de estructura en estructura. La extracción de CECA varió también de paciente en paciente. Se detectó que la distribución de CECA no es aleatoria en el lóbulo temporal: los subconjuntos fueron encontrados tanto en el lóbulo temporal mesial como en el lóbulo temporal lateral. En resumen, de detectó que existe una relación entre distintas zonas del cerebro, pudiendo dividir las ondas-punta en grupos bien diferenciados.

Otro estudio realizado por científicos franceses intentó detectar patrones de activación sobre señales de EEG [BOU/04]. Presentaron una metodología que detecta patrones de activación en señales EEG de pacientes epilépticos. Esta se basa en: (i) detección de eventos paroxísticos (monocanal), (ii) identificación de eventos paroxísticos cuasi-sincrónicos (multicanales), (iii) la extracción automática de patrones de activación similares. Los resultados demostraron que fue posible la identificación de patrones de activación reproducibles en pacientes epilépticos.

Los datos utilizados se extrajeron de EEGs de cuatro pacientes epilépticos, muestreadas a 256hz. La metodología se basó en tres pasos: 1. la detección de los eventos monocanales, 2. la construcción de una matriz representando las ocurrencias de los eventos monocanales en los eventos multicanales, y 3. la búsqueda en la matriz anterior de los conjuntos de secuencia de activación reproducible.

El objetivo fue detectar la ocurrencia de un SSW (spike o sharpwave) en un canal. Para ello se calculó la energía de la señal, y luego se aplicó un algoritmo llamado Page-Hinkley para detectar el SSW. Este algoritmo es óptimo para detectar cambios en el valor promedio de un proceso aleatorio.

Fusión de los eventos monocanales y la construcción de la Matriz. Se define como evento multicanal al conjunto de eventos monocanales que ocurren en el mismo vecindario temporal. Se utilizó un algoritmo para fusionar los eventos monocanales que son vecinos temporales, y se descartaron los eventos aislados. De esta forma se creó la matriz para evento temporal multicanal, con cada evento monocanal vecino.

Para poder realizar la búsqueda, se utilizaron técnicas de Data Mining (algoritmo a priori). Primero se detectaron aquellos grupos de vecinos mas frecuentes y luego la frecuencia de los grupos de activación extraídos.

En el siguiente gráfico, se puede ver el proceso realizado.

Figura 18 – Eventos monocanales detectados; agrupación en eventos multicanales; transformación en conjuntos de activación.

Monografias.com

Esta metodología resulto ser eficiente para la detección de patrones de activación para pacientes epilépticos. Puede ser aplicada para procesar un gran conjunto de datos. Esta demostró la existencia de patrones de activación en las señales EEG intracerebrales, y que los mismos pueden ser extraídos automáticamente. Las técnicas de Data Mining redujeron considerablemente el tiempo computacional, comparadas con las técnicas de búsqueda exhaustiva de conjuntos frecuentes. La figura 19 muestra como el método agrupó los eventos monocanales, y descartó aquellos aislados.

Figura 19 – Fusión de eventos monocanales en eventos multicanales.

Metodologías alternativas

Un estudio realizado sobre detección de activad paroxística utilizando componentes independientes plantea una metodología totalmente diferente a las vistas hasta el momento [HOE/SF]. Se desarrolló un algoritmo para la detección y la clasificación de actividad epiléptica en el EEG utilizando Análisis de Componentes Independientes (ICA). La detección y la clasificación de la actividad epiléptica fueron logradas por un algoritmo que busca actividad paroxística en el EEG. El número de componentes subyacentes y su actividad está combinada en una medida de detección (suma absoluta). Cuando una actividad paroxística es detectada, los componentes estimados son agrupados en clusters de relevancia. Estos clusters son utilizados para reconstruir una señal de EEG limpia, la cual puede ser evaluada de nuevo por la medida de detección.

Se utilizaron datos de 16 canales de EEGs con un muestreo de 200hz y digitalizados con 12 bits. Los datos contenían 71 señales paroxísticas detectadas y confirmadas.

Se pudo observar que el algoritmo basado en ICA tiene grandes posibilidades de detectar y discriminar la actividad epiléptica de varios tipos de artefactos. Esto sienta buenas bases para el desarrollo de un sistema que automatice la clasificación de los patrones electroencefalográficos de interés utilizando descomposiciones ICA.

CAPÍTULO III

Definición del problema

Es fundamental, para aquellos pacientes epilépticos candidatos a cirugía, poder detectar la zona donde se origina la crisis, denominada zona epileptógena. Los estudios que se realizan tienen, por lo general, una duración bastante prolongada, llegando en muchos casos a 72 horas de grabación de señal EEG. Esto hace muy tedioso y agotador el trabajo de los expertos para el análisis de los mismos. Es fundamental en estos casos, poder confirmar que el foco está cercano a la lesión.

Como se vio en el capítulo anterior, existen trabajos alternativos que describen el estado actual de la práctica. Queda demostrado, basándose en los trabajos anteriores, que la utilización de técnicas de Data Mining está tomando fuerza. Cada vez mas son los investigadores que se vuelcan a estas nuevas metodologías, dada su probada eficacia en diferentes áreas. Por un lado, la utilización de algoritmos inteligentes reduce sustancialmente el tiempo computacional, contra las metodologías tradicionales de análisis de señales y por el otro la aplicación de este tipo de tecnología es fácil de adquirir debido a la existencia de herramientas de acceso público disponibles. Adicionalmente, se debe agregar que además de proveer y disponibilizar continuamente nuevos métodos de análisis, por medio de la implementación de nuevos algoritmos que pueden brindar opciones en este campo, estas nuevas técnicas proveen herramientas muy poderosas que van perfeccionando de manera paralela a este campo de acción particular. Para lo cual, la posibilidad de descubrir nuevos patrones, de extraer información de gran cantidad de datos, y la simplicidad de algunos algoritmos son sus principales características.

Si bien, y como ya se planteó en capítulos anteriores, existen desarrollos en este área que utilizan algoritmos de Data Mining para la división de los conjuntos de señales [CHA/06], o la agrupación es clases de señales [BOU/04], no se realizaron metodologías que utilicen Data Mining para detectar directamente y clasificar las señales. Esta tarea se realiza con algoritmos matemáticos especiales de detección de señales.

Por otro lado, como se pudo probar en los trabajos que utilizan multicanales en EEG ([BOU/04], [BOU/05]), existe una relación directa entre distintas zonas del cerebro durante un ataque epiléptico que resulta de vital importancia a la hora de detectar las verdaderas señales paroxísticas. Una metodología que realice la clasificación de las señales paroxísticas analizando todos los canales buscando resaltar las interrelaciones que existen entre ellos ante la aparición de estas señales podría ayudar a eliminar aquellos falsos positivos (señales aisladas que son clasificadas como paroxismos), con lo cual se lograría un aumento significativo del porcentaje de clasificación positiva.

La motivación de este trabajo se genera a partir de la implementación de una metodología que ayude a los expertos en epilepsia a la detección de la topografía de la crisis epiléptica en pacientes candidatos a cirugía, automatizando la detección, disminuyendo el tiempo y esfuerzo dedicado y aumentando el porcentaje de eficacia. Esta metodología no sólo aplica en ese objetivo, sino también en la generación de un conjunto de herramientas que asistan a dichos expertos en la automatización de la detección.

La metodología desarrollada fue divida en dos etapas, para facilitar su aplicación. La primera etapa o "Preprocesamiento" realiza la preparación de los datos, en la cual se selecciona, primeramente, el conjunto de datos que se utilizará para la aplicación de la metodología. Para ello se tomaron los 10 archivos de detección que tuvieron el mejor desempeño (menor distancia en la matriz ROC) en la detección de paroxismos y, adicionalmente, se seleccionó el mismo archivo de datos de un EEG utilizado para la validación de los modelos. En este paso también se aplicaron las funciones de transformación y windowing con el objetivo de preparar los datos en el formato requerido por el aplicativo que procesa la información según los modelos seleccionados. A continuación se aplicaron los modelos que fueron seleccionados, como se expresó anteriormente, según el desempeño que prestaron. Cada modelo, está asociado a un algoritmo de clasificación de Data Mining, una función de windowing y una función de transformación. Una vez realizados estos procedimientos se continuó con la generación de marcas. En este paso se agruparon las marcas consecutivas detectadas conforme al agrupamiento seleccionado para cada caso, generando de esta forma un nuevo archivo contiendo los paroxismos agrupados.

En la segunda etapa y basándose en la información generada anteriormente, un proceso realizó la detección del canal principal, el cual está sindicado por ser el que mayor cantidad de paroxismos tiene, y se analizó la relación que existe entre éste canal y los demás en cuanto al porcentaje de cobertura, coincidencia de marcas, y cantidad de marcas detectadas. Toda esta información fue graficada para permitir el análisis por parte de los expertos.

Es de suma importancia observar que los demás métodos antes descriptos, no presentan una solución de punta a punta implementada que pueda ser tomada directamente por los expertos como aplicación en el campo.

CAPÍTULO IV

Procesamiento y análisis de los canales

Quedó demostrado en el trabajo de detección automática de paroxismos en EEG utilizando técnicas de Data Mining que es posible la identificación de la actividad paroxística en un canal. Durante el desarrollo del trabajo se generaron 8 modelos de detección de paroxismos, y se obtuvieron 68 archivos de detecciones, uno por cada modelo, utilizando agrupamiento de 1, 2, 3, 4, 5, 6, 7 y 8 marcas como mínimo consecutivas.

Tomando como base el trabajo anterior, se desarrolló una metodología que permitió el análisis de todos los canales de un electro-encefalograma, para luego detectar la propagación de la señal paroxística entre los canales involucrados. La metodología planteada se dividió en dos etapas:

Tomar los 10 archivos de detección que tuvieron el mejor desempeño (menor distancia en la matriz ROC) en la detección de paroxismos. Se seleccionó el mismo archivo de datos de un EEG utilizado para la validación de los modelos. Para cada uno de los archivos anteriores se llevó a cabo un preprocesamiento de los 32 canales de datos del EEG, teniendo en cuenta las funciones de transformación y ventanas de windowing utilizadas en cada uno. Luego se clasificaron todas las señales de los canales, separando los paroxismos (marcas) de la señal de base.

Se graficaron los 32 canales del EEG junto con sus marcas, para poder visualizar la relación existente entre ellos y determinar la propagación de la señal paroxística. Se realizaron comparaciones entre los 10 archivos de detecciones procesados, para validar la metodología.

Las dos siguientes figuras muestran la metodología aplicada.

Figura 20 – Proceso de generación de marcas aplicado a cada uno de los canales de un archivo EEG, por modelo.

Monografias.com

Figura 21 – Análisis de todos los canales simultáneamente.

Monografias.com

Selección de los datos

Para llevar a cabo este trabajo de tesis fue necesario seleccionar, por un lado el archivo de datos EEG sobre el cual realizar el análisis, y por otro lado, los archivos de modelos de detección de paroxismos a ser aplicados.

Como archivo de datos fue seleccionado el EEG utilizado en el trabajo sobre el cual se basó esta investigación: es un fragmento de un estudio de un paciente, de una duración de 269 segundos, constituido por 32 canales de datos.

Como modelos de detección de paroxismos fueron seleccionados aquellos que generaron los 10 archivos de detecciones con menor valor de distancia (curvas ROC). La siguiente tabla muestra los archivos de detecciones:

Tabla 3 – Archivos de detecciones con menor distancia.

Funciones de transformación

Según los modelos seleccionados, las funciones de transformación que mejores resultados obtuvieron fueron:

R2 y I2

sqr(R2 + I2) y atan(I/R)

Estas funciones operan sobre los valores obtenidos luego de aplicar la FFT. Como se explicó en capítulos anteriores, sobre una ventana de 64 muestras, la aplicación de la FFT genera 64 valores de salida, donde los primeros 32 corresponden a la parte real; y los siguientes 32 valores a la parte imaginaria. El primer valor de la parte real y de la parte imaginaria contiene la media de todas las muestras de entrada, por lo que son descartados.

Windowing

Se aplicaron las dos técnicas de windowing que mejores resultados obtuvieron, para atenuar los bordes de la ventana de la señal: Hanning y ventana cuadrada. Las siguientes figuras muestran la señal atenuada al aplicar la técnica.

Figura 22 – Ventana original de 64 muestras antes y después de aplicar Hanning.

Monografias.com

Figura 23 – Ventana original de 64 muestras antes y después de aplicar la función Cuadrada.

Monografias.com

Modelos seleccionados

Una vez elegidos los archivos, se seleccionaron los modelos utilizados para su generación. Cada modelo, está asociado a un algoritmo de clasificación de Data Mining, una función de windowing y una función de transformación. A continuación se puede apreciar la tabla con los modelos.

Tabla 4 – Modelos de detección de paroxismos utilizados.

Monografias.com

Preprocesamiento de la información

Antes de poder aplicar un modelo sobre un canal, fue necesario realizar un proceso de preparación de la información. Como se vio en el capítulo 2.1.9, para poder aplicar las técnicas de Data Mining, es indispensable el preprocesamiento de los datos, ya que los EEGs reflejan directamente el muestreo en escala de voltaje de la señal encefalográfica, y transformándolos se pueden potenciar las características inherentes de los paroxismos.

Desplazamiento entre ventanas

Entes de aplicar la FFT sobre un canal, fue necesario determinar un desplazamiento con el cual, al mover la ventana, se cubra el mayor porcentaje de señal, minimizando la cantidad de movimientos. En el trabajo detección automática de paroxismos en EEG utilizando técnicas de Data Mining se determinó que un desplazamiento de 8 muestras entre ventanas era el más adecuado, ya que se podía cubrir gran parte de la señal con un número aceptable de muestras y con un error en el centrado de eventos de a lo sumo 4 muestras. Por ejemplo, si se tiene el siguiente paroxismo y se quiere ver como se ajusta la ventana con un desplazamiento de 8 muestras. Suponiendo que la ventana N se encuentra centrada a 8 muestras del paroxismo, la ventana N+1 se encontrará centrada justo en el paroxismo.

Figura 24 – Ventana N a 8 muestras del paroxismo, y ventana N+1 centrada.

Monografias.com

Ahora bien, si la ventana N se encuentra centrada a 7 muestras del paroxismo, la ventana N+1 se encontrará centrada a 1 muestra del mismo. Si se sigue acercando la ventana N al paroxismo, la ventana N+1 se alejará. En el momento en que la ventana N se encuentre centrada a 4 muestras del paroxismo, lo mismo ocurrirá con la ventana N+1.

Figura 25 – Ventana N y N+1, ambas a 4 muestras del paroxismo.

Monografias.com

Se puede ver que a lo sumo una ventana puede quedar desfasada 4 muestras de un paroxismo, y que la morfología de la señal dentro de la ventana no se ve sumamente alterada.

Selección de las funciones de transformación y de windowing

Cada modelo fue creado aplicando ciertas funciones de transformación y técnicas de windowing. Fue necesario determinar, antes de preprocesar la información, cuales fueron las aplicadas en cada caso. La siguiente tabla muestra el preprocesamiento asociado a cada modelo, indicando la función de transformación, la ventana de windowing y el desplazamiento aplicado a los canales.

Tabla 5 – Preprocesamiento aplicado a cada canal, según el modelo.

Monografias.com

Preproceso

Una vez identificados los modelos y sus funciones de transformación, se procedió a aplicarlos sobre el archivo de datos del EEG. La siguiente figura muestra el proceso de transformación y preparación de los datos para un canal.

Figura 26 – Preprocesamiento de la información.

Monografias.com

Este proceso se realizó por cada canal del archivo EEG, generando un nuevo archivo de datos, para utilizado en la siguiente etapa, la aplicación del modelo de detección de paroxismos. Estos nuevos archivos de datos fueron creados con un formato especial (.arff), para poder ser procesados por los algoritmos de Data Mining provistos por WEKA, conteniendo una descripción del archivo, un encabezado y una sección con los datos. En el Anexo I se puede ver la descripción de un archivo ARFF. El encabezado enumera todos los campos utilizados en el proceso de clasificación y el campo utilizado para clasificar. El número de campos varía dependiendo de la función de transformación utilizada. Para los dos tipos de funciones utilizados el número total de campos es de 62 para los datos utilizados en el proceso y 1 campo para la clasificación.

En resumen, por cada modelo de detección de paroxismos se preprocesó cada uno de los 32 canales de señal, teniendo en cuenta la función de transformación y la ventana de windowing aplicadas al modelo.

Aplicación de los modelos de detección de paroxismos.

Una vez preprocesados los archivos, el siguiente paso consistió en aplicar de a uno los modelos de detección de paroxismos a cada uno de los canales del archivo de datos de EEG. El objetivo de esta etapa es poder detectar todos los paroxismos ocurridos en cada uno de los canales, para luego poder analizarlos en conjunto. Como se explicó anteriormente, se seleccionaron los 10 archivos de detecciones con mejor relación VP – FP (menor distancia), obteniéndose una lista de 5 modelos. Se procedió a aplicar cada uno de estos modelos a los 32 canales, generando así 160 archivos de detecciones (5 x 32 = 160).

Agrupamiento de marcas

El proceso de detección de paroxismos toma como entrada un archivo preprocesado de datos, y luego de aplicar un modelo, genera un archivo de marcas. Este archivo de marcas contiene la clasificación realizada por el modelo de cada uno de los registros del archivo de entrada. Así es como para un paroxismo ubicado en un canal en un tiempo dado, se generan uno o mas registros seguidos en el archivo de marcas del canal, indicando la presencia del evento. Por ejemplo, suponiendo que en el canal 1 del archivo de datos del EEG, en la muestra número 48 se encuentra un paroxismo punta onda. Luego de procesar el canal, se obtiene en el archivo de datos preprocesados una serie de registros seguidos (registro número 5, 6, 7, 8 y 9) donde, las características inherentes del paroxismo, determinaron que el modelo de detección los clasifique como positivos (SI). Se recuerda que se toma una ventana de 64 muestras, desplazándose sobre la señal de a 8 muestras, con lo que se obtiene una primera ventana desde la muestra 1 a la 64, identificada como registro 1; luego una segunda ventana en la muestra 9 a las 73, identificada como registro 2; y así sucesivamente. La siguiente figura muestra el ejemplo presentado anteriormente.

Figura 27 – Ejemplo de un paroxismo detectado en más de un registro.

Monografias.com

Como se puede observar en el archivo de marcas, se encuentran cinco registros seguidos clasificados como SI. Una de las características de los 10 archivos de detecciones, a demás del modelo utilizado, es el agrupamiento de marcas. Se puede decir entonces, que en el ejemplo anterior, el evento paroxístico que comenzó en el registro 5 finalizó en el registro 9. Utilizando un agrupamiento de marcas de 6 registros seguidos, este evento no sería reconocido, mientras que los agrupamientos de 1 a 5 sí lo registrarían.

Casos a procesar

Teniendo en cuenta el agrupamiento y los modelos seleccionados, se determinó la siguiente lista de casos a procesar, tal como lo muestra la tabla XXX.

Tabla 6 – Casos a procesar.

Análisis de todos los canales

Una vez generados los archivos de marcas sobre todos los canales, el siguiente paso consistió en analizar los datos recolectados, para poder entregar a los expertos la información necesaria que les permita determinar el sitio de origen de la actividad paroxística, y su propagación a través de los canales involucrados.

Se introdujo una nueva métrica para analizar la información obtenida, llamada % Cobertura sobre el canal principal. El concepto es similar a la utilizada en el proceso de medición de la eficacia de los modelos generados, introducida en el capítulo 2, salvo que en este caso no se cuenta con las marcas de expertos, sino las marcas del canal principal. El cálculo se realiza con el coeficiente de las marcas de un canal, sobre las marcas del canal principal:

% Cobertura del canal principal = Monografias.com

Para realizar el análisis, se llevaron a cabo dos procesos:

Detección del canal principal.

Cálculo de la cobertura del canal principal para cada canal

Detección del canal principal

En aquellos pacientes donde el registro de la señal del EEG se llevó a cabo en los períodos interictales, el canal principal es aquel que tiene el mayor número de paroxismos. Tal es el caso del archivo de datos utilizado para esta investigación.

La detección del canal principal se realizó mediante el procesamiento de la información de las marcas, calculando la sumatoria de los paroxismos detectados en cada canal. Posteriormente se localizó aquel que tenía la mayor cantidad de estos paroxismos y se lo marcó como principal.

Ya que cada uno de los modelos de detección de paroxismos utilizado tiene sus propias características, la detección no fue la misma en cada caso. En la siguiente tabla se puede ver la cantidad de marcas obtenidas para cada canal, por modelo.

Tabla 7 – Cantidad de marcas por canal, por caso.

Monografias.com

En color azul se puede identificar el canal con mayor cantidad de marcas, por caso analizado.

Cálculo de la cobertura de marcas

Una vez determinado el canal principal, se procedió a calcular la cobertura de marcas de cada uno de los canales sobre el total de marcas del principal. En la siguiente tabla se puede apreciar para cada canal, la cobertura.

Tabla 8 – Cobertura de marcas del canal principal.

Monografias.com

El objetivo de este procedimiento fue el de aportar toda la información necesaria a los expertos para que pudieran determinar el canal principal, y la propagación de la señal sobre los otros canales involucrados.

Gráfica de todos los canales

Para poder aportar información visual a los expertos y ayudar a determinar la organización de la descarga epiléptica, se desarrolló una aplicación que permite, entre otras funcionalidades, visualizar por modelo de detección, los paroxismos detectados en cada uno de los canales.

Figura 28 – Gráfica de todos los canales y los paroxismos asociados para el modelo J48 – Hanning – sqr(R2 + I2) y atan(I/R) – agrup 3.

Monografias.com

Como se puede ver en la figura anterior, el canal coloreado de rojo fue el que presentó la mayor cantidad de marcas, mientras que en naranja se pueden apreciar las marcas detectadas en los restantes. Se puede observar que existe una gran cantidad de actividad en más del 90% de la señal en la franja de tiempo presentada. La visualización de todos los canales y sus marcas ofrece a los expertos un modelo visual de cómo se propaga la señal desde el principal hacia los demás, y de la relación existente entre los mismos.

Resultados

Para poder entender la relación existente entre los canales y el canal principal, se graficaron las coberturas de los modelos de detección de paroxismos. Para un mejor análisis de la información se crearon dos grupos de modelos. En la siguiente tabla se pueden ver los dos grupos.

Tabla 9 – Grupos de modelos generados.

Monografias.com

La figura 29 muestra el porcentaje de cobertura para los modelos del grupo 1. Como se puede apreciar, el canal 0 y el canal 1 presentan la mayor concentración de marcas, y en el 80 % de los casos del grupo 1 fueron seleccionados como canal principal. Existe únicamente un caso que pareciera no presentar la misma tendencia que los demás. Es el caso 3, el cual tiene al canal 8 como el principal. También se puede observar que los canales 16 a 18, y 20 a 24 presentan gran cantidad de actividad paroxística, junto a la del canal principal.

Figura 29 – Grupo 1 – Gráfico de la cobertura del canal principal en los canales restantes.

Monografias.com

Realizando el mismo análisis sobre el gráfico de la figura 30 se puede observar el grupo 2. Este grupo es más homogéneo, ya que el 100% de los casos presentan al canal 0 o al canal 1 como el de mayor concentración de marcas. También se puede observar una gran actividad paroxística en los canales 16 a 18, y 20 a 24.

Figura 30 – Grupo 2 – Gráfico de la cobertura del canal principal en los canales restantes.

Monografias.com

En resumen, el 90% de los casos tienen al canal 0 o al canal 1 como canal principal (el 60% al canal 0, y el 30% al canal 1). Los canales 16 a 17, y 20 a 24 presentan actividad paroxística.

Los canales no son independientes unos de otros, ya que la actividad epiléptica desarrollada en uno afecta a los que se encuentran en la misma zona, dependiendo de la disposición de los electrodos. En los capítulos 2.1.4 y 2.2.2 se discutió esta situación.

Para poder analizar la relación existente entre los canales, se graficaron los canales de cada caso por separado, dividiéndolos en tres grupos: el primer grupo corresponde a los canales que tienen una cobertura inferior al promedio de las coberturas de todos los canales, quitando el canal principal. El segundo grupo corresponde a los que tiene un valor superior o igual al promedio, y el último grupo corresponde al canal principal.

Monografias.com

A continuación se pueden ver los gráficos resultantes para casa uno de los casos analizados.

Figura 31 – Caso 1 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Se puede observar que después del canal 1 (canal principal) los canales 0, 4, 5, 7, 10, 11, 17, 18, 21, 22 y 24 presentan actividad paroxística mayor o igual que el promedio. Estos canales evidentemente se encuentran relacionados al canal principal, ya que la actividad paroxística se propaga desde el canal 1 hacia ellos. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 32 – Caso 2 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

En el caso 2, los canales que presentan mayor o igual actividad paroxística que el promedio son los canales 1, 4, 5, 7, 10, 11, 16, 17, 20, 21, 23, y 24. Estos canales evidentemente se encuentran relacionados al canal principal, ya que la actividad paroxística se propaga desde el canal 0 hacia ellos. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 33 – Caso 3 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Este caso se pude considerar atípico. Por la naturaleza del modelo utilizado para calcular las detecciones, el canal 8 fue seleccionado como principal ya que presentó la mayor cantidad de paroxismos. Si bien para todos los modelos se utilizó el mismo conjunto de funciones de transformación, ventana de windowing y agrupamiento, la combinación de ellos evidentemente generó una clasificación de los paroxismos distinta a la de los demás. No es el objetivo de este trabajo de tesis hacer un análisis del porqué de este comportamiento, simplemente se tomó como un caso aislado.

Figura 34 – Caso 4 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Se puede observar que después del canal 1 (canal principal) los canales 0, 5, 10, 11, 16, 17, 20, 21, 22, 23 y 24 presentan actividad paroxística mayor o igual que el promedio. Estos canales evidentemente se encuentran relacionados al canal principal, ya que la actividad paroxística se propaga desde el canal 1 hacia ellos. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 35 – Caso 5 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

En el caso 5, los canales que presentan mayor o igual actividad paroxística que el promedio son los canales 1, 5, 12, 16, 17, 19, 20, 21, 22, 23, y 24. Estos canales se encuentran en la zona de propagación de la señal paroxística desde el canal principal. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 36 – Caso 6 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Este caso es muy similar al caso anterior, los canales que presentan mayor o igual actividad paroxística que el promedio son los canales 1, 5, 12, 16, 17, 19, 20, 21, 22, 23, y 24. Estos canales se encuentran en la zona de propagación de la señal paroxística desde el canal principal. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 37 – Caso 7 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Como se puede observar en el gráfico, existe un subgrupo de canales alrededor del canal principal que presenta mayor o igual concentración de paroxismos que el promedio (canales 0, 2, y 3). También los canales 16, 17, 20, 21, 22, 23 y 24 confirman el grupo de canales con mayores paroxismos que el promedio. Estos canales también se encuentran en la zona de propagación de la señal paroxística desde el canal principal. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 38 – Caso 8 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Este caso es muy similar al caso anterior, existe un subgrupo de canales alrededor del canal principal que presenta mayor o igual concentración de paroxismos que el promedio (canales 1, 2, y 3). También los canales 16, 17, 20, 21, 22, 23 y 24 confirman el grupo de canales con mayores paroxismos que el promedio. Estos canales también se encuentran en la zona de propagación de la señal paroxística desde el canal principal. Los canales restantes, si bien presentan actividad, no superan el promedio.

Figura 39 – Caso 9 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Los gráficos del caso 9 y del caso 8 muestran los mismos resultados. Esto se debe a que se utilizaron el mismo algoritmo de data mining, la misma función de transformación y la misma ventana de windowing. La única diferencia fue el agrupamiento de marcas, que si bien influye en el número final de paroxismos detectados por canal, en proporción es el mismo para ambos casos. Para el caso 8 se utilizó J48 – Hanning – sqr(R2 + I2) y atan(I/R) – Agrup 3, mientras que para el caso 9 se utilizó J48 – Hanning – sqr(R2 + I2) y atan(I/R) – Agrup 4.

Figura 40 – Caso 10 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas.

Monografias.com

Este caso presenta un subgrupo alejado del canal principal, a diferencia de la mayoría de los casos anteriores. Si bien los canales con casi los mismos, alrededor del canal principal sólo se encuentra el canal 1. Los canales 16, 17, 18, 20, 21, 22, 23, 24 y 29 conforman el grupo de canales con mayor o igual paroxismos que el promedio, junto con el canal 1.

Como se puede apreciar, existen tres grupos de canales que estarían relacionados con el canal principal. Dependiendo del modelo de detección de paroxismos utilizado y el agrupamiento, los conjuntos varían, pero en el 90 % de los casos, se obtuvieron los mismos conjuntos. La siguiente tabla muestra los conjuntos obtenidos por cada caso.

Tabla 10 – Comparativa de los casos aplicados, teniendo en cuenta el grupos de canales.

La tabla muestra que en la mayoría de los casos, los canales involucrados son los mismos. Efectivamente existe un grupo de canales que se ven afectados al canal principal (canales del 16 al 17, del 20 al 24) entre un 80% y un 100% de los casos. En un porcentaje mejor (40% a 60%), los canales 10 y 11, canal 1, canal 3 y canal 5. Sin conocer la topología del montaje, se podría deducir que junto con el canal principal, se ven afectados los canales 16 al 17 y 20 al 24. La señal comienza en el canal principal y se propaga hacia ellos. En menor medida se ven afectados los canales 10 y 11, 1, 3 y 5.

CAPÍTULO V

Herramienta desarrollada

Para poder llevar a cabo el trabajo de tesis, se desarrolló una herramienta que facilitó el proceso de análisis, y automatizó las tareas de generación de las detecciones de paroxismos. Con ella se puede visualizar un archivo de datos EEG (archivos con extensión .dat), seleccionar un modelo de detección, aplicar el modelo, seleccionar el agrupamiento de marcas, y graficar los paroxismos detectados en todos los canales. Se utilizó Visual Basic 6.0 para el desarrollo de las interfaces con el usuario, y Visual C++ para el desarrollo de librerías que realizaron los cálculos complejos. Para aplicar los algoritmos de Data Mining se utilizó WEKA, utilizando las facilidades de línea de comandos que posee.

Para poder correr los algoritmos de Data Mining, fue necesario determinar el directorio donde se encuentran las librerías de WEKA, así también como las librerías de runtime de java para poder ejecutarlas. Para ello se desarrolló una ventana de configuración en la herramienta para poder localizar los programas y librerías necesarias. La primera vez que se ejecuta la herramienta, aparecerá la pantalla que se puede ver en la siguiente figura.

Figura 41 – Pantalla de configuración.

Monografias.com

La primera vez que se ejecuta la herramienta, se requerirá el ingreso de los datos básicos de configuración (directorio de las librerías de WEKA, runtime de java y, si es necesario, un editor de texto externo).

Una vez configurada, aparecerá la pantalla principal, donde, por medio de un menú, se pueden acceder a las opciones de procesamiento de la información. La siguiente figura muestra esta pantalla.

Figura 42 – Pantalla principal de la herramienta.

Monografias.com

Selección del archivo de datos

Para poder visualizar el archivo de datos EEG sobre el cual se va a trabajar, se desarrolló una pantalla donde se pueden observar todos los canales a la vez. El primer paso es seleccionar el archivo, presionando las teclas ALT+A, o haciendo clic con el mouse sobre la opción Archivos de Datos. Los datos de los canales son graficados en la pantalla. Para poder cargar el archivo, es necesario que exista en el mismo directorio un archivo de texto con la configuración del mismo. Por ejemplo, para el archivo de datos SAdsig.dat es necesario que se encuentre en el mismo directorio el archivo SAdsig.txt. En la siguiente figura se puede ver el contenido del mismo.

Figura 43 – Archivo SAdsig.txt asociado al archivo de datos de EEG.

Monografias.com

La figura siguiente muestra los datos de los canales, como ejemplo, para el archivo SAdsig.dat.

Figura 44 – Archivo SAdsig.dat y sus canales.

Monografias.com

Para poder identificar a cada uno de los canales se les asignó un número a la izquierda de la pantalla de datos. Para poder analizar los datos, y ajustar la porción de datos a visualizar, se agregaron dos barras de slide que permiten aumentar y disminuir la frecuencia de muestreo y la amplitud de la señal.

Figura 45 – Barras para modificar la amplitud y la frecuencia de la señal.

Monografias.com

Sobre la barra de progreso que se encuentra en el margen inferior de la ventana, se puede encontrar información de los datos que se están visualizando, como se puede ver en la siguiente figura. Haciendo clic sobre el casillero de selección rotulado Visualizar Tiempo/Nro.Muestra se conmuta entre tiempo (HH:MM:SS.CCC) y número de muestras.

Figura 46 – Información de los datos visualizados.

Monografias.com

Selección del modelo y generación de detecciones

Una vez elegido el archivo de datos a procesar, se deberá seleccionar un modelo de detección de paroxismos a ser aplicado. Presionando las teclas ALT+M o haciendo clic sobre el menú Modelo, y luego seleccionando la opción Obtener Archivo Modelo, se puede elegir el modelo de detección. Una vez seleccionado el modelo, se puede aplicar siguiendo los mismos pasos para acceder al menú de modelos, y luego seleccionando la opción Generar Detección. Esta etapa es fundamental ya que realiza la detección automática de los paroxismos sobre cada uno de los canales. Dependiendo del modelo de detección utilizado, se obtienen detecciones diferentes. Este proceso genera para cada archivo de datos, un directorio con el mismo nombre del archivo. A su vez, por cada modelo de detección aplicado al archivo de datos, se genera en forma anidada, un directorio con el nombre del modelo. De esta forma se pueden acceder a los datos en forma ordenada, para su posterior análisis.

Análisis de los datos y visualización de marcas

Una vez aplicado el modelo de detección al archivo de datos, se debe proceder al agrupamiento de las marcas o paroxismos detectados, para luego poder realizar el análisis del canal principal y los canales relacionados. Para ello se deberá presionar las teclas ALT+N o hacer clic sobre el menú Analizar. En este momento se requerirá el ingreso de la agrupación de marcas a utilizar. Una vez ingresado el agrupamiento, comenzará el proceso de análisis y visualización de marcas.

Se desarrolló un algoritmo que detecta el canal principal, y luego calcula, para cada uno de los canales restantes, porcentajes de cobertura, coincidencias de marcas con el canal principal y cantidad de marcas de cada canal. Toda esta información es utilizada por el experto para su posterior análisis. Junto a la señal de cada canal, se pude observar una ventana con los datos estadísticos. La siguiente figura muestra las marcas detectadas para los 32 canales de datos del archivo SAdsig.dat, utilizando el modelo mod_j48.J48_cc0_c0_tvc_v64d8_c_cr0_AB.modelo y un agrupamiento de 3 marcas.

Figura 47 – Marcas detectadas para los 32 canales del archivo SAdsig.dat, y las estadísticas generadas.

La primera columna del cuadro de estadísticas corresponde a la cantidad de paroxismos detectados en cada canal. En rojo se puede observar el canal principal (con mayor cantidad de marcas). La segunda columna corresponde al porcentaje de la señal de las marcas del canal principal que coinciden con las marcas de cada uno de los canales. La última columna muestra la cantidad de marcas del canal principal que coincide con las marcas de cada canal.

CAPÍTULO VI

Conclusiones y Trabajos Futuros

Conclusiones

En la presente tesis se ratificó la detección automática de paroxismos en EEGs de pacientes epilépticos, utilizando técnicas de Data Mining, planteada en el trabajo de detección automática de paroxismos en EEG utilizando técnicas de Data Mining. Se localizaron los paroxismos en todos los canales de un EEG, permitiendo un análisis de toda la actividad paroxística, tanto en forma visual, como en forma analítica.

La detección de paroxismos en múltiples canales, la localización del canal principal y el análisis de la propagación de la actividad paroxística hacia los demás canales involucrados contribuirá con los expertos en la detección de la señal epiléptica en todos los canales de un EEG, reduciendo considerablemente el tiempo de detección realizado manualmente, ya que permitió la automatización del proceso.

Se trabajó sobre un conjunto de datos acotados, un archivo se señal EEG interictal de un paciente candidato a cirugía, utilizando los modelos que obtuvieron la mejor relación VP-FP (menor distancia) en la detección de paroxismos.

Se desarrolló una herramienta capaz de localizar en un EEG el canal principal donde se origina la actividad epiléptica. Asimismo, es posible graficar conjuntamente todos los canales de un archivo de datos de un EEG, y aplicar cualquiera de los modelos de detección de paroxismos, permitiendo visualizar las marcas encontradas en los canales, y así tener una imagen de la propagación de la actividad epiléptica.

Todos los casos aplicados fueron analizados y permitieron corroborar la existencia de una relación entre el canal principal, donde se origina la actividad, y los canales involucrados en la propagación. Se pudo determinar la relación existente entre ellos, y cuales fueron los grupos de canales asociados.

Para este trabajo de tesis se desarrolló una herramienta capaz de analizar y detectar los paroxismos en un EEG con señal interictal de pacientes epilépticos. Ésta utiliza modelos de detección de paroxismos que, en un primer análisis realizado por expertos, detectaron muchos falsos positivos. Si bien esto es un efecto no deseado, se compensa con el ahorro de tiempo al realizar la detección automática. En muchos casos los estudios a analizar son de hasta 72 horas de grabación,

Trabajos futuros

Una mejora a los modelos de detección podría ser realimentarlos, generando un nuevo modelo indicando los falsos positivos como señal de base, para que en futuras detecciones no sean clasificados como paroxismos. También se podrían introducir en los modelos los nuevos paroxismos detectados, para aumentar el desempeño y mejorar la clasificación.

Durante las reuniones realizadas con los expertos para este trabajo de tesis, se planteó la necesidad de marcar un rango de tiempo en donde se encuentren un grupo de paroxismos, y permitir agruparlos para realizar un análisis posterior. Una mejora a la herramienta desarrollada podría ser la selección de períodos de tiempo abarcando todos los canales, permitir la agrupación de los mismos, y exportarlos en un formato estándar, por ejemplo el formato EDF (European Data Format), compatible con otros programas de análisis de señal.

También se planteó la necesidad de, si se detecta un canal de datos con mucho ruido, permitir su eliminación del análisis; y de poder eliminar un paroxismo detectado por el algoritmo que se presume es un falso positivo. Estas podrían ser otras mejoras a la herramienta desarrollada.

CAPÍTULO VII

Referencias Bibliográficas

[CAZ/03] Cazamajou, E. – Valenti, P. – Scarpettini, M. – Aizemberg, A. – Silva, W. – Kochen, S.: "Automatic Detection of Interictal Spikes using Data Mining Models". Facultad de Ciencias Exacta y Naturales, Universidad de Buenos Aires. Abril 2003.

[DIE/32] Dietsch, G.: "Fourier Analyse von Elektrenkephalogrammen des Menschen", Pflüger's Arch. Ges. Physiol., 230:106-112.

[CAB/99] Cabanyes, J. – Truffino: "Cartografía cerebral: metodología y aplicaciones en la clínica neurológica", REV NEUROL 1999; 28 (11): 1090-1098.

[WIT/00] Witten, Ian H. – Frank, Eibe: "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations", Morgan Kaufmann Publishers, 2000.

[SWE/88] Swets J.: "Measuring the accuracy of diagnostic systems". Science, 240:1285-1293, 1988.

[CHA/06] Chaovalitwongse, W. – Prokopyev, O. – Pardalos, P.: "Electroencephalogram (EEG) time series classification: Applications in epilepsy", C_Springer Science+Business Media, LLC 2006.

[DIR/SF] Direito, B. – Dourado, A. – Vieira, M. – Sales, F.: "Classification of epileptic EEG data using multidimensional scaling", Centro de Informática e Sistemas da Universidade de Coimbra Department of Informatics Engineering Polo II Universidade 3030-290 Coimbra, Portugal.

[BOU/05] Bourien, J. – Bartolomei, F. – Bellanger, J.J. – Gavaret, M. – Chauvel, P. – Wendling, F.: "A method to identify reproducible subsets of co-activated structures during interictal spikes. Application to intracerebral EEG in temporal lobe epilepsy", ELSEVIER, Clinical Neurophysiology 116 (2005) 443-455.

[BOU/04] Bourien, J. – Bellanger, J. J. – Bartolomei, F. – Chauvel, P. – Wendling, F.: "Mining Reproducible Activation Patterns in Epileptic Intracerebral EEG Signals: Application to Interictal Activity". IEEE Transactions on Biomedical Engineering, Vol. 51, N° 2, Febrary 2004.

[HOE/SF] Hoeve,M. – van der Zwaag, B. – van Buril, M. – Slump, K. – Jones, R.: "Detecting Epileptic Seizure Activity in the EEG by Independent Component Analysis". Colosseum 2, 7521 PT Enschede, the Netherlands.

Anexo

ANEXO I – Estructuras de los Archivos de Datos.

Archivos de señales EEG (extensión SIG)

Estos archivos de datos fueron generados con un software llamado HARMONIE versión 5.0b de enero del 2001. Este software es comercializado por la empresa Stellate Systems Inc., radicada en Canadá. Debido a que es un paquete comercial, la información de los archivos se encuentra codificada en un formato propietario. No se dispone de la estructura de los mismos.

Archivos de Datos (extensión DAT)

Estos archivos son una versión de los archivos SIG, en un formato binario, de 16 bits por muestra, representando un entero con signo. Dependiendo del archivo, pueden tener 17 o 32 canales de datos, multiplexados en orden por canal, o sea que todas las muestras correspondientes al mismo instante se guardan juntas:

donde mi,p es la muestra i correspondiente al canal p, y k toma los valores 17 o 32.

Archivos Preprocesados (extensión ARFF)

Estos archivos son la entrada a los algoritmos de Data Mining. Una vez pre-procesados los archivos de señales EEG, quedan en este formato.

Figura 48 – Ejemplo de un archivo preprocesado.

@relation CANAL01_V64_D8_f

@attribute campo1 real

@attribute campo2 real

@attribute campo3 real

@attribute campo4 real

@attribute campo5 real

@attribute campo6 real

@attribute campo7 real

@attribute campo8 real

@attribute campo9 real

@attribute campo10 real

@attribute campo11 real

…

@attribute campo59 real

@attribute campo60 real

@attribute campo61 real

@attribute campo62 real

@attribute tipo {NADA, SI}

@data

72.35, 59.11, 17.25, 1.00, …, 0.83, -1.27, 1.09, 1.32, -1.46, -0.18, NADA

56.42, 59.62, 31.49, 9.47, …, 0.75, 1.46, -1.34, -0.98, -0.79, -0.40, NADA

55.31, 52.31, 27.14, 4.10, …, -0.20, -1.08, 1.45, -1.49, -0.37, -0.28, NADA

51.32, 59.81, 29.14, 1.58, …, 0.08, 0.14, 0.01, -0.86, 1.36, 0.23, NADA

97.24, 84.61, 49.30, 1.83, …, 1.07, 0.57, -0.91, -1.34, 1.10, 1.54, NADA

57.35, 67.36, 27.44, 8.49, …, -1.54, -0.09, 1.16, -0.21, 0.35, -0.85, NADA

………………………………………………………………….

9.51, 9.11, 4.36, 2.00, …, 0.66, 1.21, 0.34, 1.12, 1.16, 0.10, NADA

7.90, 4.50, 3.51, 1.67, …, 0.42, 0.39, -0.16, -1.02, -1.16, 0.20, NADA

7.03, 1.94, 4.69, 3.33, …, -1.20, 1.53, -0.40, 1.04, 0.42, -0.28, NADA

8.78, 6.70, 6.04, 4.55, …, 0.35, -0.34, 0.64, 0.01, -1.49, -0.45, NADA

12.03, 8.83, 6.29, 4.70, …, -1.46, 1.08, 0.18, -0.37, -0.59, -0.22, NADA

14.79, 6.36, 5.71, 3.83, …, -1.48, -0.62, -1.16, 0.10, 0.37, 0.04, NADA

Como se puede ver en la figura anterior, un archivo ARFF se divide en tres secciones:

En la primera sección se encuentra el nombre de la relación, en este caso un nombre arbitrario CANAL01_V64_D8_f.

En la segunda sección se encuentra la declaración de los atributos o campos. Según el tipo de función de transformación utilizada, éstos pueden ser 32 o 63. En cualquiera de los dos casos, todos los atributos son de tipo real, salvo el último atributo correspondiente a la clase {SI , NADA}, que es nominal.

Y por último la tercera sección con los datos. Cada fila es un registro constituido por 32 o 63 campos.

Archivos de modelo generado (.MODELO)

Son archivos binarios, generados en el momento de aplicar uno de los algoritmos de Data Mining de WEKA, por lo cual no pueden ser editados. Contienen la información del modelo generado. En este caso, se almacenaron cada uno de los modelos con el nombre del clasificador utilizado y la extensión MODELO.

Archivos de marcas generadas

Un archivo de marcas está compuesto por cuatro columnas, donde la primera representa el número de registro procesado, la segunda columna representa la clasificación otorgada por el modelo (puede ser SI o NADA), la tercera columna es un valor que representa la probabilidad que tiene ese registro de pertenecer a la clase asignada, y la cuarta columna corresponde a la clasificación original que tenía el registro antes de aplicar el modelo.

Figura 49 – Ejemplo de un archivo de marcas.

Monografias.com

Archivos de detecciones generadas

Estos archivos contienen las detecciones generados por los modelos. Un archivo de este tipo tiene formato de texto plano, dividido en tres columnas: la primera columna representa un número de muestra, el segundo un canal, y el tercero un rótulo. Cada detección está conformada por dos registros consecutivos representando una ventana o rango, donde el primer campo del primer registro representa el valor inicial, y el primer campo del segundo registro el valor final del rango. El rótulo o tercer campo del primer registro es siempre ISI, mientras que el rótulo del segundo registro es siempre F. El segundo campo de ambos registros tiene siempre el mismo valor.

El siguiente ejemplo muestra un archivo de detecciones generadas.

Figura 50 – Archivo ejemplo de detecciones.

LISTA DE FIGURAS

Figura 1 – Ejemplo de EEG. 8

Figura 2 – Esquema que representa el montaje para un registro monopolar. 10

Figura 3 – Esquema de un montaje para un registro bipolar. 10

Figura 4 – Montaje longitudinal bipolar (A), transversal bipolar (B). Cada segmento situado entre dos puntos representa un canal de registro. 11

Figura 5 – Colocación de los sensores. 12

Figura 6 – Punta onda, ondas agudas y polipuntas. 14

Figura 7 – Ejemplo de Árbol de Decisión. 23

Figura 8 – Etapas de la metodología propuesta. 25

Figura 9 – Selección de una ventana de tiempo de 64 muestras, equivalente a 320 milisegundos. 26

Figura 10 – Proceso de preparación de datos. 28

Figura 11 – Gráfico de Curva ROC ejemplo. 31

Figura 12 – Comparación de Curvas ROC para los Expertos E1, E2 y los modelos generados. 33

Figura 13 – Representación en tres dimensiones de la entropía, STLmax y frecuencia angular para un EEG. 35

Figura 14 – Validación cruzada. 35

Figura 15 – Hiperplano separando diferentes estados del cerebro. 36

Figura 16 – Representación en VISRED 39

Figura 17 – EEG. 41

Figura 18 – Eventos monocanales detectados; agrupación en eventos multicanales; transformación en conjuntos de activación. 44

Figura 19 – Fusión de eventos monocanales en eventos multicanales. 45

Figura 20 – Proceso de generación de marcas aplicado a cada uno de los canales de un archivo EEG, por modelo. 54

Figura 21 – Análisis de todos los canales simultáneamente. 54

Figura 22 – Ventana original de 64 muestras antes y después de aplicar Hanning. 56

Figura 23 – Ventana original de 64 muestras antes y después de aplicar la función Cuadrada. 57

Figura 24 – Ventana N a 8 muestras del paroxismo, y ventana N+1 centrada. 58

Figura 25 – Ventana N y N+1, ambas a 4 muestras del paroxismo. 59

Figura 26 – Preprocesamiento de la información. 60

Figura 27 – Ejemplo de un paroxismo detectado en más de un registro. 62

Figura 28 – Gráfica de todos los canales y los paroxismos asociados para el modelo J48 – Hanning – sqr(R2 + I2) y atan(I/R) – agrup 3. 67

Figura 29 – Grupo 1 – Gráfico de la cobertura del canal principal en los canales restantes. 69

Figura 30 – Grupo 2 – Gráfico de la cobertura del canal principal en los canales restantes. 69

Figura 31 – Caso 1 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 71

Figura 32 – Caso 2 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 72

Figura 33 – Caso 3 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 73

Figura 34 – Caso 4 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 74

Figura 35 – Caso 5 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 75

Figura 36 – Caso 6 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 76

Figura 37 – Caso 7 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 77

Figura 38 – Caso 8 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 78

Figura 39 – Caso 9 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 79

Figura 40 – Caso 10 – Gráfica de la cobertura de los canales en relación al promedio de las coberturas. 80

Figura 41 – Pantalla de configuración. 84

Figura 42 – Pantalla principal de la herramienta. 85

Figura 43 – Archivo SAdsig.txt asociado al archivo de datos de EEG. 86

Figura 44 – Archivo SAdsig.dat y sus canales. 86

Figura 45 – Barras para modificar la amplitud y la frecuencia de la señal. 87

Figura 46 – Información de los datos visualizados. 87

Figura 47 – Marcas detectadas para los 32 canales del archivo SAdsig.dat, y las estadísticas generadas. 89

Figura 48 – Ejemplo de un archivo preprocesado. 98

Figura 49 – Ejemplo de un archivo de marcas. 99

Figura 50 – Archivo ejemplo de detecciones. 100

LISTA DE TABLAS

Tabla 1 – Matriz de confusión. 30

Tabla 2 – Efectividad del clasificador SVM. 37

Tabla 3 – Archivos de detecciones con menor distancia. 55

Tabla 4 – Modelos de detección de paroxismos utilizados. 57

Tabla 5 – Preprocesamiento aplicado a cada canal, según el modelo. 60

Tabla 6 – Casos a procesar. 63

Tabla 7 – Cantidad de marcas por canal, por caso. 65

Tabla 8 – Cobertura de marcas del canal principal. 66

Tabla 9 – Grupos de modelos generados. 68

Tabla 10 – Comparativa de los casos aplicados, teniendo en cuenta el grupos de canales. 81

Enviado por:

Ing.+Lic. Yunior Andrés Castillo S.

"NO A LA CULTURA DEL SECRETO, SI A LA LIBERTAD DE INFORMACION"®

www.monografias.com/usuario/perfiles/ing_lic_yunior_andra_s_castillo_s/monografias

Santiago de los Caballeros,

República Dominicana,

2015.

"DIOS, JUAN PABLO DUARTE Y JUAN BOSCH – POR SIEMPRE"®

Partes: 1, 2

Página anterior

Volver al principio del trabajo

Página siguiente